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摘 要 : [目的 /意义 ] DE AREER KAR, MEERA, 、 调 节 和 群体 结构 的 重要 指标 之 一 。 目 前 大 
田 环境 下 小 麦 叶片 计数 主要 依靠 人 工 、 耗 时 耗 力 ， 而 现 有 的 自动 化 检测 计数 方法 的 效率 与 精度 难以 满足 实际 应 用 
需求 。 为 提高 小 麦 叶片 数 检测 的 准确 性 ， 设 计 了 一 种 复杂 大 田 环 境 下 高 效 识 别 小 麦 叶 尖 的 算法 。[ 方 法 ] 本 研究 以 
手机 和 田间 摄像 头 获取 的 可 见 光 图 像 构建 了 两 种 典型 光照 条 件 下 出 苗 期 、 分 坦 期 、 越 冬 期 等 多 个 生长 期 的 小 麦 叶 
片 图 像 数 据 集 。 以 YOLOv8 为 基础 网 络 ， 融 合 坐标 注意 力 机 制 降低 背景 环境 的 干扰， 提高 模型 对 小 麦 叶 尖 轮廓 信 
息 的 提取 能 力 ; 替换 损失 函数 加 快 模型 收敛 速度 ; 增加 小 目标 检测 层 提高 对 小 麦 叶 尖 的 识别 效果 ， 降 低 漏 检 率 。 
设计 了 一 种 适用 于 叶 尖 小 目标 识别 的 深度 学 习 网 络 ， 通 过 检测 图 像 叶 尖 数量 从 而 得 出 叶片 数 。[ 结 果 与 讨论 ] 本 研 
究 提 出 的 方法 对 小 麦 叶 尖 的 识别 精确 率 和 mAP, ,分 别 达到 91.6% 和 85.1%， 具 有 良好 的 检测 效果 。 在 复杂 大 田 环境 
下 该 方法 具有 更 好 的 适应 能 力 ， 能 够 在 不 同 光 照 条 件 下 实现 自 适 应 检测 ， 模 型 鲁 棒 性 强 。 小 麦 幼 苗 期 叶片 检测 漏 
检 率 低 ， 说 明 该 方法 能 够 满足 复杂 大 田 场景 下 小 麦 叶 尖 识 别 的 需求 ， 提 高 了 小 麦 叶片 数 检测 的 准确 性 。[ 结 论 ] 本 
研究 可 为 复杂 大 田 场 景 下 小 麦 叶片 数 检测 的 研究 提供 参考 ， 为 小 麦 长 势 高 质量 评估 提供 技术 支撑 。 
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0 引言 


随 着 现代 农业 技术 的 快速 发 展 ， 作 物 生长 状态 
的 实时 监测 和 精准 管理 成 为 了 提高 作物 产量 和 质量 
的 关键 "。 小 麦 作为 全 球 重要 的 粮食 作物 之 一 ， 其 
生长 监测 、 产 量 预测 以 及 田间 管理 优化 具有 重要 意 
义 “。 小 麦 生长 过 程 中 的 叶片 数 是 衡量 植株 生长 状 


况 、 预 测 产量 的 重要 指标 之 一 ”。 小 麦 幼 苗 期 的 叶 
片 数量 是 决定 植株 养分 吸收 效率 及 光合 作用 能 力 的 
关键 因素 ， 同 时 对 小 考分 药 的 形成 以 及 最 终 产 量 的 


收 稿 日 期 : 2024-03-15 


金 项 目 : HAA 


然 科 学 基金 项 目 (32371993); ATE 


fe try a RE PEPE, WE Ae EST DAL 
群体 结构 的 重要 指标 。 纵 观 小 麦 叶片 检测 方法 的 发 
展 历程 ， 可 以 得 出 : 基于 人 工 计 数 的 方法 具有 主观 
性 强 、 效 率 低 且 劳动 强度 大 的 弊端 ; 基于 仪器 的 检 
测 方法 获得 结果 受 外 界 环境 等 因素 影响 ;基于 数理 
统计 的 检测 方法 工作 量 大 ， 受 限于 专业 的 统计 学 和 
农学 知识 。 

近年 来 ， 随 着 计算 机 算 力 的 不 断 提升 ， 深 度 学 
习 技 术 在 目标 检测 领域 广泛 应 用 “”。 与 传统 的 目 
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标 检 测算 法 相 比 ， 深 上 度 卷 积 神经 网 络 (Convolu- 
tional Neural Network, CNN) 具有 强大 的 特征 学 习 
能 力 ， 能 够 从 海量 的 训练 数据 中 自主 挖掘 多 层次 的 
特征 表达 “7"。 基 于 卷 积 神经 网 络 的 目标 检测 算法 
如 YOLO (You Only Look Once) 和 SSD (Single 
Shot Detector) 一 阶 检 测 需 系列 和 Faster R-CNN 
(Faster Region-Based Convolutional Neural Network) 
两 阶 检测 需 系 列 已 被 证 实在 对 作物 的 识别 上 取得 了 
不 错 的 效果 “" 。 众 多 学 者 不 断 优 化 和 改进 这 些 深 
度 学 习 算 法 模型 ， 并 尝试 将 其 应 用 于 叶片 识别 与 计 
数 的 研究 中 。Xu 等 提出 了 一 种 结合 半 监 督学 
习 、 深 度 学 习 以 及 无 人 机 数字 成 像 技术 用 于 田间 玉 
米 幼苗 叶片 计数 的 方法 ， 对 于 完全 展开 的 叶片 和 新 
出 现 的 叶片 ， 计 数 准 确 率 分 别 为 69.4% 和 72.9%。 
Deb $F U 提出 名 为 LC-Net 的 新 型 CNN 模型， 通过 
结合 叶片 局 部 特征 和 全 局 图 像 信 息 ， 在 公开 测试 集 
上 的 叶片 计数 精确 率 优 于 现 有 技术 。Praveen 和 
Domnic ” 提出 了 一 种 提取 植物 数字 图 像 中 叶片 区 
域 并 计算 叶片 数量 的 有 效 方法 ， 在 叶子 分 割 挑 战 的 
基准 数据 集 上 实现 了 95.4% 的 分 割 精度 。Yigit 等 0” 
利用 神经 网 络 和 文 持 向 量 机 (Support Vector Ma- 
chine, SVM) 设计 了 一 种 植物 叶片 的 自动 识别 器 ， 
SVM 模型 识别 准确 率 为 92.91%。Xie 等 5 基于 一 
种 CNN 提出 深度 回归 模型 ， 降 低 训 练 成 本 的 同时 
提高 了 叶片 计数 的 准确 性 。Kolhar 和 Jagtap "使 用 
U-Net 和 分 水 岭 算法 实现 了 植物 叶片 的 分 割 与 计数 ， 
平均 叶片 计数 误差 为 0.26。 


a. 小 麦田 间 场 景 


b. 手机 拍摄 的 越冬 期 小 麦 图 像 


国内 研究 者 运用 深度 学 习 方法 针对 叶片 识别 与 
计数 的 研究 取得 了 一 定 成 效 ， 但 依旧 存在 一 些 问 
题 。 例 如 ， 对 小 麦 叶片 数 检测 研究 较 少 ， 大 田 青 景 
复杂 会 使 算法 将 背景 误 判 ， 缺 乏 对 于 特定 场景 下 的 
小 麦 叶片 数 检测 研究 。 因 此 ， 本 研究 利用 手机 和 田 
间 摄 像 头 获取 的 可 见 光 图 像 构建 数据 集 ， 对 小 麦 叶 
尖 进 行 标注 ， 提 出 基于 YOLOv8-CSD (You Only 
Look Once-CA、 SIoU, Small Object Detection Lay- 
er) 模型 的 小 麦 叶片 数 检测 方法 。 通 过 替换 损失 画 
数 加 快 模型 收敛 速度 ， 般 入 坐标 注意 力 机 制 (Co- 
ordinate Attention, CA) 强化 小 麦 叶 尖 目 标 特征 ， 增 
加 小 目标 检测 层 以 拓宽 模型 的 感受 野 ， 提 高 小 麦 叶 
尖 识 别 准确 性 ， 从 而 通过 检测 叶 尖 数量 推断 出 小 麦 
叶片 数 。 该 方法 为 小 麦 叶 片 数 快速 检测 提供 了 可 行 
方案 ， 为 复杂 大 田 场景 下 小 麦 的 生长 监测 提供 参考 
依据 ， 以 便于 更 精确 地 评估 小 麦 的 生长 情况 。 


1 试验 材料 
1.1 图 像 采 集 


小 麦 数 据 集 采 集 地 点 位 于 安徽 省 合肥 市 庐阳 区 
合肥 高 新 技术 农业 园 ， 采 集 时 间 为 2023 年 11 月 19 
日 至 2024 年 2 月 10 日 。 使 用 手机 OPPO Renol0 基 
于 小 麦 分 蔓 节 25、35 和 50 cm 高 度 处 分 别 拍摄 图 
像 。 采 用 海 康 威 视 DS-2DE4423IW-D/GLTXM 在 放 
大 5$ 倍 、10 倍 、15 倍 、20 倍 情况 下 分 别 采 集 图 像 ， 
设备 距 地 面 高 度 为 3.5 m。 图 1 展示 了 小 麦田 间 场 
景 ， 以 及 手机 、 田 间 摄 像 头 拍摄 的 田间 小 麦 图 像 。 


MORI OFPOL 
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c. 田间 摄像 头 拍摄 的 分 药 期 小 麦 图 像 


图 1 不 同 设备 拍摄 的 小 麦 图 像 数据 示例 


Fig.l Example of wheat images captured by different devices 


为 实现 小 麦 叶 尖 识 别 与 叶片 数 检测 的 目标 ， 分 
别 在 小 麦 出 苗 期 、 分 星期 、 越 冬 期 等 幼苗 关键 生长 
阶段 采集 图 像 ， 全 面 捕捉 小 麦 幼苗 期 不 同 生 长 阶段 
的 形态 特征 。 复 杂 大 田 场 景 下 采集 的 图 像 涵盖 多 样 
的 背景 元 素 、 小 麦 的 生长 变化 ， 以 及 不 同 的 光照 条 


件 。 如 图 1b 所 示 ， 由 于 杂 草 以 及 残留 作物 秸秆 共 
同 构成 了 复杂 的 视觉 环境 ， 难 以 分 割 ， 严 重 干 扰 了 
小 麦 叶片 的 准确 检测 。 因 此 ， 对 采集 的 小 麦 图 像 通 
过 调整 对 比 度 等 操作 进行 数据 增强 处 理 。 鉴 于 大 田 
小 麦 采 用 撤 播 方式 种 植 ， 密 度 大 ， 在 分 慕 期 以 后 会 
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出 现 叶 片 密集 相互 遮挡 的 问题 ， 获 取 叶 片 图像 数 据 
时 ， 手 机 平行 于 地 面 拍 援 ， 摄 像 头 采 用 垂直 俯视 角 
度 拍 摄 。 由 于 自然 光照 条 件 的 不 断 变化 ， 如 日 照 角 
度 和 强度 的 波动 以 及 由 此 产生 的 阴影 效果 ， 进 一 步 
增加 了 图 像 处 理 的 难度 ， 因 此 ， 选 择 在 晴天 和 阴 天 
分 别 采集 数据 ， 提 升 模型 在 实际 应 用 中 的 泛 化 性 。 
表 1 为 不 同 生 长 期 不 同 光 照 条 件 下 获取 的 小 麦 图 像 
数据 集 。 

表 1 不 同 设备 拍摄 的 不 同 生长 期 和 光照 条 件 的 小 麦 图 像 数 

据 组 成 


Table 1 Composition of wheat image data captured by different 


2 算法 模型 构建 和 评价 指标 
2.1 YOLOv8 算 法 


YOLOv8 是 Ultralytics 公司 开源 的 一 种 单 阶段 
目标 检测 算法 ， 该 系列 模型 有 n、s、m、1 和 x 这 5 
个 版 本 ， 模 型 参数 量 依次 增加 。 其 主干 网 络 ” 由 
卷 积 模块 (ConvModule, CONV) 、C2f (CSPLay- 
er_2Conv) 模块 、 空 间 金 字 塔 池 化 (Spatial Pyra- 
mid Pooling -Fast, SPPF) 模块 组 成 。CONV 模块 封 
装 了 三 个 功能 ， 包 括 卷 积 (Conv2d)、 批 量 归 一 化 
层 (Batch Normalization, BN) 和 激活 函数 Si- 
LU 5， 其 作用 是 对 输入 的 特征 图 执行 卷 积 操作 ， 
从 而 提取 特征 ， 识 别 目标 。C2f 模 块 用 于 将 高 层 特 
征 与 低层 特征 进行 融合 ， 以 获取 更 丰富 的 语义 信 


devices with different growth stages and lighting conditions 
SFE SY NE 26 Ar: 
ggg TEONE RRK a h u 
出 苗 期 ABE ” 越冬 期 ” 晴天 WHR 
手机 187 323 254 354 410 
间 摄 像 头 = 62 44 48 58 
总 数 187 385 298 402 468 
注 :“ 一 ”表示 无 。 


1.2 数据 集 构 建 


综合 考虑 硬件 条 件 和 试验 参数 的 需要 ， 同 时 为 
了 便于 模型 训练 ， 利 用 Python 语言 编写 的 随机 裁剪 
缩放 函数 将 手机 获取 的 原始 图 像 裁剪 成 分 辨 率 像 
素 640X640 图 像 ， 将 田间 摄像 头 获 取 的 分 辩 率 
像素 为 2 560X 1 440 的 可 见 光 图 像 缩放 至 像素 为 
640X 640 的 输入 模型 。 小 麦 叶 尖 形态 特征 明显 ， 相 
对 容易 识别 ， 故 利用 LabelImg 标 注 软件 对 进行 预 处 
理 过 后 的 小 麦 叶 片 图 像 进行 边界 框 标注 ， 通 过 最 小 
外 接 和 矩形 标注 出 小 麦 叶 尖 。 

为 增强 数据 集 的 多 样 性 ， 提 高 模型 泛 化 能 
实现 小 麦 叶 尖 识别 和 叶片 数 检测 的 目标 ， 本 研究 选 
取 手 机 原始 图 像 数据 764 张 ， 经 旋转 后 ， 每 张 原 
始 图 像 被 扩充 成 2 张 像 素 为 640X640 的 图 像 ， 共 
计 1528 张 。 考 虑 到 图 像 质量 不 高 会 造成 特征 提取 
困难 ， 手 动 剔 除了 过 度 曝光 、 质 量 较 低 的 图 像 。 经 
过 筛选 后 ， 剩 余 1 426 张 图 像 构 成 数据 集 。 选 取 田 
间 摄 像 头 获取 的 106 张 原始 图 像 ， 经 过 缩放 裁剪 后 
共计 420 张 放 入 数据 集 。 将 数据 集 按 照 8 : 2 的 比例 
划分 为 训练 集 和 剩余 集 ， 在 剩余 集中 进一步 平均 随 
机 划分 ， 将 其 中 的 一 部 分 作为 验证 集 ， 另 一 部 分 作 
为 测试 集 ， 形 成 最 终 数据 集 。 其 中 ， 训 练 集 1 477 
张 ， 验 证 集 185 张 ， 测试 集 184 张 ， 共 标记 出 31748 个 
小 麦 叶 人 尖 。 


息 。SPPF 模 块 则 在 通过 将 不 同 尺度 的 特征 汇集 到 
固定 大 小 的 特征 图 中 来 加 快 网 络 的 计算 。Neck 网 
络 保留 使 用 路 径 聚 合 网 络 -特征 金字 塔 网 络 (Fea- 
ture Pyramid Networks- Path Aggregation Network, 
PAN-FPN) 结构 ， 加 强 了 特征 信息 。Head 网 络 采 
用 解 耦 头 结构 ， 将 分 类 和 检测 头 分 离 ; 采用 无 锚 分 
体式 检测 头 ， 保 证 在 较 短 时 间 对 图 像 物体 进行 识别 
和 检测 ， 有 效 地 提高 了 检测 速度 。 

2.2 WA CA EJW 


注意 力 机 制 通过 让 深度 学 习 网 络 更 加 关注 需要 
关注 的 地 方 ， 提 升 神 经 网 络 的 性 能 ， 目 前 广泛 应 用 
于 计算 机 视觉 任务 中 号 。 但 常规 注意 力 机 制 易 忽 
略 目标 空间 位 置信 息 S AFERRA TA 
草 难以 分 割 ， 小 麦 叶片 与 杂 草 颜色 相似 性 高 ， 导 致 
识别 准确 性 下 降 。 为 提高 模型 对 小 麦 叶 尖 轮廓 信息 
的 提取 能 力 ， 减少 背景 环境 的 干扰 ， 在 YOLOv8m 
模型 中 舰 入 CA 注意 力 机 制 。 该 机 制 充分 考虑 了 通 
道 信 息 和 方向 相关 的 位 置信 息 的 关联 性 ， 能 够 使 感 
兴趣 的 区 域 更 准确 地 被 捕获 ， 提 升 模型 特征 提取 能 
力 ， 帮 助 网 络 更 好 地 识别 目标 2”。 

CA 注意 力 机 制 对 输入 特征 图 进行 两 个 一 维 全 
局 池 化 操作 ， 分 别 得 到 宽度 和 高 度 方向 上 的 特征 映 
射 ， 接 着 将 两 个 特征 映射 合并 形成 一 个 新 的 特征 
层 。 对 合并 后 的 特征 层 进行 卷 积 操 作 和 激活 操作 进 
一 步 获得 特征 图 。 之 后 沿 着 空间 维度 将 新 获得 的 特 
征 图 进行 split 操 作 分 离 出 宽度 和 高 度 方向 的 特征 
ke, 结合 Sigmoid 激 活 函 数 2 得 到 在 宽度 与 高 度 方 
向 上 的 注意 力 向 量 。 最 后 ， 将 原始 输入 特征 图 进行 
加 权 计 算 ， 输 出 在 宽度 和 高 度 方向 上 带 有 注意 力 权 
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重 的 特征 图 。 
2.3 优化 损失 函数 


YOLOv8 算 法 中 ， 预 测 框 回归 损失 采用 完全 交 
并 比 (Complete Intersection over Union, CloU) 损 
RARO, TA PRE BESTE TU AER BEA , 
而 没有 考虑 到 真实 框 与 预测 框 之 间 的 方向 ， 导 致 模 
型 收敛 速度 较 慢 ， 影 响 整 体检 测 性 能 。 由 于 复杂 大 
田 场 景 下 分 莫 期 以 后 的 小 麦 叶片 密集 相互 遮挡 ， 叶 
尖 识 别 变 得 困难 。 为 了 加 快 预测 框 回归 到 真实 框 的 
速度 ， 提 高 对 小 麦 叶 人 尖 的 识别 效果 ， 本 研究 采用 形 
状 交 并 比 (Shape Intersection Over Union, SIoU) 
损失 函数 "1 替换 CIoU HA Pw. Ask (1) 为 
SIoU HA PM, FAAS (2) 角度 损失 入 、 公 
式 (3) 距离 损失 A、 公式 (4) 形状 损失 Q。 图 2 为 
SIU 参数 示意 图 。 


A+Q 


Losssyu=1-IoU+ (1) 
Wr vot ra ti (2) 
oO 4 
A=2-e%:-e™ (3) 
Q= > (ery (4) 


式 中 : IoU (Intersection over Union) 为 预测 框 
与 真实 框 之 间 的 交 并 比 ; HH 为 预测 框 和 真实 框 中心 
点 的 横 坐 标 之 差 ; 6 为 真实 框 和 预测 框 中 心 点 距离 ， 
px; y 为 赋予 时 间 的 距离 值 ; p, 和 pp, 分 别 为 真实 框 
与 预测 框 中 心 点 最 小 外 接 框 宽 比 值 的 平方 和 最 小 外 
接 框 高 比值 的 平方 ; 9 为 控制 对 形状 损失 的 关注 程 
度 ， 参 数 范 围 为 [2，6]; W 为 预测 框 和 真实 框 中 
心 点 的 纵 坐标 之 差 。 


2.4 添加 小 目标 检测 层 


原始 的 YOLOv8 模 型 使 用 三 种 不 同 尺寸 的 特征 
图 进行 目标 检测 : 80 X80 像素 的 特征 图 用 于 检测 像 
素 大 小 在 8X8 以 上 的 目标 ; 40X40 像 素 的 特征 图 
用 于 检测 像素 大 小 16X16 以 上 的 目标 ; 20X20 像 
素 的 特征 图 用 于 检测 像素 大 小 在 32X32 以 上 的 较 
大 目标 。 然 而 ， 由 于 出 苗 期 小 麦 叶 尖 尺 寸 较 小 ， 其 


BT (bE be") 


B(b,.b, 


注 :B 和 B®” 点 分 别 为 预测 框 和 真实 框 中 心 点 ;HH 和 W 分 别 为 B 和 B® 
点 横 坐 标 与 纵 坐标 之 差 ;G 为 真实 框 和 预测 框 中 心 点 距离 ;Q 为 两 中 
心 点 连 线 与 水 平 线 的 夹 角 。 

图 2 SIOU 参数 示意 图 


Fig.2 SIoU parameters schematic diagram 


宽度 和 高 度 均 小 于 8 像素 ， 原 始 模型 可 能 无 法 准确 
捕捉 到 网 格 内 的 小 麦 叶 尖 特征 信息 。 因 此 ， 通 过 增 
加 小 目标 检测 层 ， 即 在 原始 模型 中 新 增 一 个 像素 大 
小 为 160X160 的 检测 特征 图 ， 充 分 利用 底层 特征 
的 高 分 辨 率 信 息 和 深层 特征 的 高 语义 信息 ， 在 保持 
计算 效率 的 同时 ， 让 网 络 更 加 关注 小 麦 叶 尖 的 特征 
言 息 ， 从 而 提高 小 麦 叶 尖 的 检测 效果 。 

2.5 小 麦 叶 尖 识 别 算法 模型 


考虑 到 实际 生产 条 件 下 平台 算 力 的 限制 ， 为 了 
实现 小 麦 叶 尖 识别 精度 与 检测 速度 的 平衡 ， 本 研究 
基于 YOLOv8m 网 络 进行 改进 ， 提 出 了 YOLOv8- 
CSD 算 法 模型 。YOLOv8-CSD PKA CATER A BL 
制 来 突出 重要 的 通道 特征 ， 增 强 小 麦 叶 尖 识 别 能 
力 ; 蔡 换 损失 函数 加 快 模型 训练 收敛 速度 ; 添加 小 
目标 检测 层 提 升 模型 对 细节 的 敏感 性 ， 解 决 较 小 叶 
尖 的 识别 问题 。YOLOv8-CSD 检测 头 包 括 4 个 检测 
层 ， 具 体 如 表 2 所 示 。 其 中 ， 输 出 特征 图 像素 为 
20X20 的 检测 层 具有 较 大 的 感受 野 ， 适 合 识别 大 尺 
才 目 标 。 输 出 特征 图 像素 为 160X 160 的 检测 层 具 
有 较 小 的 感受 野 ， 适 合 捕捉 小 尺寸 目标 。40X40 像 
素 和 80X80 像素 的 检测 层 ， 分 别针 对 检测 中 等 尺 
寸 和 较 小 尺寸 的 目标 。YOLOv8-CSD 网 络 结构 如 
图 3 所 示 。 


表 2 YOLOv8-CSD 模型 检测 头 组 成 
Table 2 Composition of detection head for YOLOv8-CSD model 


特征 图 /像素 20X20 40X40 80X80 160X 160 
感受 野 大 中 较 小 小 


HANE (116,90) (156,198) (373,326) 


(30,61) (62,45) (59,119) 


(10,13)(16,30)(33,23) (5,7) (9,13) (11,15) 
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主干 网 络 
Backbone 


SPPF 


Neck ti 


Caf 


输入 
Input C2f 


注 : 红色 实 线 框 为 小 目标 检测 层 添加 位 置 ; 位 置 1、 位 置 2、 位 置 3 为 添加 CA 注意 力 机 制 位 置 。 


检测 头 
Head 


Detect 
(20X20) 


输出 
位 置 2 Output 
个 a Tee 


SS 


Detect 
(40X40) 


Detect 
(80X 80) 


Detect 
(160X 160) 


图 3 YOLOv8-CSD 网 络 结构 图 
Fig.3 YOLOv8-CSD network structure diagram 


2.6 模型 训练 与 评价 指标 


2.6.1 ”模型 训练 环境 

本 研究 使 用 Windows 10 操 作 系 统 ， 内 存 为 
32 G， 显 卡 型 号 为 NVIDIA GeForce RTX 4060 8 GB, 
搭载 13th Gen Intel (R) Core (TM) i5-13500HX 
处 理 器 ， 深 度 学 习 框 架 采 用 PyTorch1.12， 编 程 平 
台 为 PyCharm， 编 程 语言 为 Python3.10， 所 有 对 比 
算法 均 在 相同 环境 下 运行 。 

实验 图 像 输 入 像素 尺寸 640X640， 并 配合 使 用 
Mosaic 数 据 增强 。 在 模型 训练 过 程 中 ， 初 始 学 习 率 
为 0.01， 配 合 优 化 器 Adam (Adaptive Moment Esti- 
mation Optimizer) 调整 学 习 率 。 设 定 权重 衰减 率 为 
0.000 5， 动 量 因子 为 0.937。 在 进行 性 能 测试 时 ， 
预测 的 结果 采用 非 极 大 值 抑制 。 
2.6.2 ”评价 指标 

本 研究 采用 精确 率 (Precision, P), A E% 
(Recall, R), mAP,, (Mean Average Precision) 以 及 
模型 大 小 等 指标 进行 模型 评价 ， 各 评价 指标 计算 如 
公式 (5) 和 公式 (6) 所 示 。P 表 示 在 所 有 模型 预 
测 为 小 麦 叶 尖 的 结果 中 ， 预 测 正确 数量 占 总 数 的 比 
例 ; RR 表 示 模 型 预测 为 小 麦 叶 尖 的 数量 占 实际 叶 尖 


数量 的 比例 。 
TP 

P = Tp+EP (5) 
TP 

R= py FN (6) 


式 中 : TP、FP、FN 分 别 为 真正 例 、 假 正 例 、 


hx Bl; DAR ABH, PAB, PRH RAY 
面积 定义 为 平均 精度 (Average Precision, AP), AP 
越 大 ， 说 明 检 测 结果 越 好 。mAP,: 是 AP 值 在 所 有 
类 别 下 的 均值 。 


3 结果 与 分 析 
3.1 消融 实验 


在 消融 实验 中 ， 为 保证 对 比 合理 性 ， 所 有 模型 
均 使 用 相同 的 数据 集 ， 并 在 相同 的 参数 条 件 下 进行 
训练 。 为 对 比 使 用 CA 注意 力 机 制 模块 、 蔚 换 损 失 
函数 模块 和 增加 小 目标 检测 层 模块 对 原 YOLOv8 模 
型 带 来 的 性 能 提升 表现 ， 进 行 模型 消融 实验 ， 对 比 
结果 如 表 3 所 示 ， 可 知 在 YOLOv8 中 添加 CA 注意 
力 机 制 ， 与 原 模 型 相 比 ， 召 回 率 和 mAP,, 分 别提 高 
0.9% 和 1.4%; 和 蔡 换 损失 函数 SIoU 后 ， 召 回 率 和 
mAP,; 分 别提 高 了 0.5% 和 0.4%; 通过 添加 小 目标 
检测 层 ， 与 原 YOLOv8 模型 对 比 ， 召 回 率 和 mAP,， 
分 别提 高 了 3.2% 和 3.1%; 改进 的 YOLOv8 模 型 对 
小 麦 叶 尖 的 识别 精确 率 、 召 回 率 、mAP,; 分 别 为 
91.6%、80.0% 和 85.1%。 与 原 YOLOv8 相 比 ， 分 别 
提高 2.3%、6.4% 和 3.3%。 


3.2 不 同 网 络 模 型 识别 性 能 对 比 实验 

为 验证 本 研究 提出 的 YOLOv8-CSD 算法 模型 
在 复杂 大 田 场景 下 小 麦 叶 片 数据 集 上 检测 的 有 效 
性 ,选择 当前 主流 的 二 阶 网 络 模型 Faster R-CNN、 
Mask R-CNN (Mask Region-based Convolutional 
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表 3 小 麦 叶 尖 识 别 研究 中 改进 YOLOv8 模型 的 消融 实验 
Table 3 Improved YOLOv8 model ablation experiment for 


wheat leaf tip recognition research 


表 4 小 麦 叶 尖 识别 研究 中 不 同 模型 的 检测 性 能 对 比 平 均值 
Table 4 Comparison of detection performance average of differ- 


ent models in wheat leaf tip recognition research 


号 添加 CA 注 替换 SIoU 添加 小 目 a jo A 
意 力 机 制 ”损失 函数 标 检 测 层 a 
1 x x x 893 73.6 81.8 
2 v x x 90.2 74.5 83.2 
3 x v x 89.7 74.1 82.2 
4 x x v 90.0 768 849 
5 v v v 91.6 80.0 85.1 


TE: \ 表 示 使 用 该 模块 ，x 表 示 没 有 使 用 该 模块 。 


Neural Network) °°) 与 一 阶 网 络 模型 YOLOv7 :25 、 
YOLOv8、SSD 共 6 种 网 络 模 型 在 相同 的 训练 环境 
下 进行 对 比 实验 。 选 择 评价 指标 从 精确 率 、 召 回 
率 、mAP,; 得 到 对 比 实验 结果 ， 如 表 4 所 示 ， 所 有 
数据 均 为 平均 值 。 从 表 4 中 得 出 ， 二 阶 卷 积 神经 网 
络 Faster R-CNN、Mask R-CNN 检测 效果 较 差 ， 
mAP,; 远 低 于 其 他 一 阶 网络 模 型 ， 可 能 在 特征 提取 
阶段 不 如 一 阶 模型 优化 得 当 ， 导 致 在 复杂 背景 的 小 
目标 检测 上 的 性 能 较 差 ; 本 研究 提出 的 YOLOv8- 
CSD 的 mAP,; 能 够 达到 85.1%， 与 原 YOLOv8 相 比 ， 
提升 3.3%， 召 回 率 提高 6.4%; 与 YOLOv7 和 SSD 
相 比 ，mAP,; 分 别提 高 了 13.3% 和 13.6%. YO- 
LOv8-CSD 模 型 在 小 麦 叶 尖 识 别 精 度 方面 优 于 其 他 
模型 ， 模 型 占用 内 存 较 小 且 召 回 率 大 幅度 提高 ， 说 
明 改 进 后 的 模型 能 够 减少 背景 因素 的 和 干扰， 对 小 麦 
叶 尖 的 定位 能 力 更 好 ， 因 此 本 研究 提出 的 模型 更 适 
用 于 复杂 大 田 场 景 下 小 麦 叶 尖 识 别 与 叶片 数 的 
检测 。 

不 同 模 型 在 数据 集 上 的 可 视 化 实验 结果 如 图 4 
所 示 ， 可 看 出 ， 本 研究 提出 的 模型 收敛 速度 较 快 ， 
并 且 能 够 在 短 时 间 内 训练 出 较 优 的 模型 。 


3.3 不 同 设备 获取 图 像 检 测 效果 对 比 
为 探究 YOLOv8-CSD 模型 对 不 同 设备 获取 的 


re 
Recall 


“M 


Epoch 


a. 模型 Precision 对 比 


Epoch 


b. 模型 Recall 对 比 


模型 P/%  R/% mAP,,/% 模型 大 小 /MB 
Faster R-CNN 70.9 50.4 58.7 108.2 
Mask R-CNN 79.3 54.8 61.6 244.0 
YOLOv7 87.2 625 71.8 74.8 
YOLOv8 89.3 73.6 81.8 49.7 
SSD 85.6 61.9 71.5 78.1 
YOLOv8-CSD 91.6 80.0 85.1 52.2 


小 麦 叶片 图 像 的 检测 效果 ， 对 验证 集中 143 张 手机 
拍摄 图 像 和 42 张 田间 摄像 头 拍 摄 图 像 进 行 对 比试 
验 。 选 择 识 别 精确 率 、 召 回 率 、mAP,; 作 为 评价 指 
标 ， 得 到 YOLOv8-CSD 模型 对 不 同 设 备 获取 图 像 
的 具体 检测 结果 。 根 据 表 5 可知， 模型 在 检测 手机 
拍摄 的 小 麦 叶片 图 像 时 ， 叶 人 尖 识 别 的 mAP。s; 达 到 了 
86.78% ， 而 田间 摄像 头 拍摄 图 像 叶 尖 识别 的 mAP,: 
为 82.43%。 了 田间 摄像 头 拍 摄 图 像 的 叶 尖 识别 精度 与 
手机 相 比 偏 低 ， 这 是 由 于 两 种 设备 获取 的 图 像 空 间 
分 辨 紊 大 小 不 一 样 、 采 用 的 预 处 理 方式 不 一 样 以 及 
摄像 头 平行 地 面 拍摄 范围 有 限 ， 导 致 处 理 后 图 像 数 
据 所 包含 的 小 麦 叶 尖 数量 有 一 定 的 差距 ， 因 此 在 进 
行 小 麦 叶 尖 识 别 时 会 出 现 不 同 设备 的 识别 精度 差 。 
但 YOLOv8-CSD 模 型 在 检测 两 种 不 同 设备 获取 的 
小 麦 叶 片 图 像 时 ， 叶 人 尖 识 别 的 mAP,; 均 超过 80% , 
说 明 应 用 YOLOv8-CSD 模型 能 够 有 效 识 别 两 种 不 
同 设备 拍摄 的 小 麦 叶 尖 。 

表 5 YOLOv8-CSD 模 型 对 不 同 设备 获取 的 小 麦 叶 片 图 像 

检测 结果 对 比 

Table 5 Comparison of detection results of wheat leaf images 
obtained from different devices using YOLOv8-CSD model 


图 像 采 集 设备 P/% R/% mAP, s/% 
] 间 摄像 头 90.18 78.16 82.43 
手机 92.43 83.51 86.78 
| 和 wi 
= | Nf Ma 
F R-CNN E f ga al Paster R-CNN 
Master R-CNN | ff A 村 Master R-CNN 


Epoch 


c. 模型 mAP, ,对 比 


图 4 小 麦 叶 尖 识别 研究 中 不 同 模型 检测 性 能 对 比 图 


Fig. 4 Comparison of detection performance of different models in wheat leaf tip recognition research 
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3.4 模型 改进 前 后 复杂 环境 检测 效果 对 比 


本 研究 旨 在 探究 YOLOv8-CSD 模 型 在 复杂 
田 环境 下 对 小 麦 叶 尖 的 检测 效果 。 考 虑 到 手机 能 
从 多 角度 捕 提 包含 杂 草 干扰 及 叶片 相互 遮挡 情况 的 
小 麦 图 像 ， 本 研究 从 测试 集中 随机 选取 手机 拍摄 的 
小 麦 叶片 图 像 ， 分 别 输入 YOLOv8 和 YOLOv8-CSD 
模型 进行 对 比 实验 。 检 测 结果 如 图 $ 所 示 。 在 杂 草 
及 叶片 相互 遮挡 的 复杂 条 件 下 ，YOLOv8-CSD 模型 
较 YOLOv8 模 型 检测 置信 度 更 高 ， 对 于 小 麦 叶 尖 的 
识别 更 准确 。 在 图 5 中， 存在 叶片 遮挡 情况 的 原始 
图 像 中 标注 了 被 诞 挡 区 域 ，YOLOv8 未 能 识别 出 ， 
而 YOLOv8-CSD 能 够 有 效 识 别 ， 说 明 本 研究 提出 
的 模型 鲁 棒 性 更 优 。 


YOLOvS YOLOvS-CSD 


图 5 YOLOv8 和 YOLOv8-CSD 对 两 种 复杂 场景 下 小 麦 叶片 图 
像 的 检测 效果 
Fig. 5 The detection effect of YOLOv8 and YOLOv8-CSD on 


wheat leaf images in two complex scenes 


原始 图 像 


考虑 到 田间 摄像 头 能 够 持续 捕获 时 序 性 的 可 见 
光 图 像 ， 本 研究 采用 其 获取 图 像 评估 模型 改进 前 后 
在 不 同 光照 条 件 下 对 小 麦 叶 尖 的 检测 效果 ， 结 果 如 
图 6 所 示 。 对 比 YOLOv8 模 型 和 YOLOv8-CSD 模 型 
对 不 同 光照 条 件 下 小 麦 叶 尖 检 测 结 果 的 置信 和 度 ， 
YOLOv8-CSD 模 型 检测 置信 和 度 均 有 明显 提升 。 

模型 改进 前 后 两 种 典型 光照 条 件 下 具体 检测 情 
况 对 比 结果 如 表 6 所 示 ， 可 知 ， 在 晴天 环境 下 YO- 
LOv8 模 型 对 小 麦 叶 尖 的 召回 率 仅 有 77%， 这 是 由 
于 在 晴天 小 麦 叶 片 经 太阳 光照 射 产生 的 阴影 可 能 喘 
在 真正 的 叶片 上 ， 而 模型 把 叶片 阴影 当成 叶片 ， 导 
致 识别 精度 和 召回 率 降 低 。 而 YOLOv8-CSD 模型 
在 两 种 典型 光照 条 件 下 对 小 麦 叶 人 尖 的 召回 率 均 达 
80%， 说 明 应 用 本 模型 能 够 在 不 同 光 照 条 件 下 做 到 
自 适应 调整 ， 模 型 鲁 棒 性 更 好 。 


WR q 


原始 图 像 ~ YOLOvS : YOL reese 
图 6 YOLOv8 fe YOLOv8-CSD 对 两 种 典型 光照 条 件 下 拍摄 
的 小 麦 叶片 图 像 检 测 效 果 图 


Fig. 6 Detection effect of wheat leaf images captured under 


two typical lighting conditions 


表 6 YOLOv8 和 YOLOv8-CSD 对 两 种 典型 光照 条 件 下 拍 
摄 的 小 麦 叶 片 图 像 检测 结果 对 比 
Table 6 Comparison of detection results of wheat leaf images 
captured under two typical lighting conditions using YOLOv8 
and YOLOv8-CSD 


光照 条 件 模型 RI% mAP, ,/% 
YOLOv8 80.6 77.0 
阴 天 
YOLOv8-CSD 82.7 82.2 
YOLOv8 77.0 71.9 
晴天 
YOLOv8-CSD 80.9 76.1 


3.5 模型 改进 前 后 不 同 生长 期 检测 效果 对 比 


鉴于 手机 拍摄 图 像 的 叶 尖 识别 精度 高 ， 本 研究 
从 测试 集中 随机 选取 手机 拍摄 的 小 麦 在 出 苗 期 、 分 
BES 、 越 冬 期 的 叶片 图 像 ， 分 别 输入 YOLOv8m 和 
YOLOv8-CSD 中 进行 实验 ， 观 察 置 信 度 情况 ， 检 测 
结果 如 图 7 所 示 。 其 中 ，YOLOv8-CSD 对 出 苗 期 和 
分 药 期 小 麦 叶 尖 检测 框 的 置信 和 度 在 0.9 左 右 ， 相 比 
于 YOLOv8 模 型 的 0.8 有 所 提升 ; 在 越冬 期 小 麦 叶 
片 图 像 的 检测 中 ，YOLOv8-CSD 检 测 框 的 平均 置信 
度 为 0.8， 表 现 优 于 标准 YOLOv8 模型 。 检 测 框 置 
信和 度 越 高 说 明 模 型 在 学 习 过 程 中 更 好 地 捕捉 到 了 目 
标的 细节 特征 ， 目 标 存在 的 可 能 性 越 大 。 本 研究 提 
出 的 YOLOv8-CSD 模 型 柑 入 CA 注意 力 机 制 可 以 突 
出 重要 的 通道 特征 ， 添 加 小 目标 检测 层 可 以 提升 对 
细节 的 敏感 度 ， 从 而 更 好 地 捕捉 小 麦 叶 尖 。 实 验 结 
果 说 明 改 进 后 的 YOLOv8-CSD 相 较 于 原 YOLOv8 
模型 具有 更 好 的 检测 效果 ， 这 一 结论 为 后 续 小 麦 叶 
片 数 检测 提供 了 技术 支撑 。 
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YOLOvS 


YOLOys-CSD 


HM j pe 越冬 期 


图 7 YOLOv8 和 YOLOv8-CSD 对 不 同 生 长 期 小 麦 叶 尖 识别 效果 


Fig. 7 Recognition effects of YOLOv8 and YOLOv8-CSD on the 


leaf tips of wheat at different growth stages 


a. 出 苗 期 


b. > 


3.6 复杂 大 田 场景 下 小 麦 叶 片 数 检测 效果 


小 麦 的 叶片 数 是 评估 作物 生长 状况 、 调 节 群 体 
结构 、 指 导 生 产 管理 的 关键 指标 之 一 。 然 而 ， 在 实 
际 大 田 场 景 下 ， 小 麦 通常 采用 无 人 机 撒播 ， 种 植 密 
度 大 ， 人 工 识 别 费时 费力 且 易 出 现 漏 检 情况 。 为 验 
证 改进 后 模型 的 检测 效果 ， 选取 小 麦 在 出 苗 期 、 分 
蓝 期 和 越冬 期 三 个 生长 阶段 采用 1m 双 行 方式 进行 
叶片 数 检测 拍摄 的 8 张 小 麦 叶片 图 像 ， 其 中 出 苗 期 
包含 103 个 叶片 ;分 坦 期 包含 476 个 叶片 ; 越冬 期 
包含 742 个 叶片 。 输 入 训练 后 的 YOLOv8-CSD 进行 
检测 ， 效 果 如 图 8 所 示 ， 可 以 看 出 ，YOLOv8-CSD 
模型 基本 能 够 有 效 识 别 复杂 大 田 场 景 下 小 麦 叶 尖 。 


Ty tanh 


c. 越 冬 期 


图 8 复杂 大 田 场景 下 YOLOv8-CSD 对 不 同 生 长 期 小 麦 叶 片 数 检测 效果 
Fig.8 The detection effect of YOLOv8-CSD on the number of wheat leaves with different growth stages in complex field scenes 


小 麦 叶片 数 具体 检测 结果 统计 如 表 7 所 示 ， 可 
知 矢 入 CA 注意 力 机 制 的 YOLOv8-CSD 模 型 对 小 麦 
叶 尖 的 识别 性 能 较 好 ,尤其 是 在 小 麦 叶 片 较为 稀 政 
的 出 苗 期 ,模型 能 够 实现 小 麦 叶 人 尖 的 有 效 识别 。 在 
分 工期 和 越冬 期 小 麦 叶 片 漏 检 率 分 别 为 1.6% 和 
2.8% ， 这 一 结果 说 明 本 研究 所 提出 的 方法 泛 化 能 
强 ， 能 够 满足 实际 复杂 大 田 场景 下 小 麦 叶 片 数 检测 
的 需求 。 

#7 YOLOv8-CSD 对 不 同 生长 期 小 麦 叶 片 数 检测 结果 统计 
Table 7 Statistics of the number of wheat leaves detected by 
YOLOv8-CSD at different growth stages 


生长 期 检测 数 /个 漏 检 数 /个 ”模型 检测 总 时 间 /s 
出 苗 期 103 0 1.45 
ay Hes 468 8 2.27 
越冬 期 721 21 2.63 
4 结 论 


针对 复杂 大 田 场景 下 深度 学 习 网 络 模型 在 提取 
特征 与 学 习 的 能 力 不 足 的 问题 ， 本 研究 在 YOLOYv8 
模型 的 基础 上 进行 改进 ， 通 过 和 藤 入 CA 注意 力 模 块 


来 提升 模型 的 感知 能 力 ， 更 好 地 捕获 小 麦 叶 尖 目 
标 ; 修改 损失 函数 ， 把 方向 尺度 的 损失 考虑 到 模型 
训练 中 ; 增加 小 目标 检测 层 进一步 优化 特征 提取 ， 
最 终 提出 了 复杂 大 田 场 景 下 的 小 麦 叶 尖 识别 方法 。 
改进 后 的 YOLOv8-CSD 模 型 mAP,; 可 达 85.1%, 与 
主流 目标 检测 模型 Faster R-CNN、Mask R-CNN、 
YOLOv7 和 SSD 相 比 ， 模 型 占用 内 存 最 小 ， 但 识别 
精确 率 最 高 。 相 较 于 原 模 型 ， 召 回 率 和 mAP,; 分 别 
提升 了 6.4% 和 3.3%。YOLOv8-CSD 模 型 对 手机 和 
田间 摄像 头 获取 的 小 麦 叶 片 图 像 进行 检测 时 ， 叶 尖 
识别 的 mAP,; 分 别 达 到 86.78% 和 82.43%。 人 研究 结 
果 表 明 ， 该 模型 能 够 有 效 识别 两 种 不 同 设备 拍摄 的 
小 麦 叶 尖 。 在 复杂 大 田 环 境 下 ，YOLOv8-CSD 模 型 
具有 更 好 的 适应 能 力 ， 能 够 有 效 减少 杂 草 和 叶片 谈 
挡 情 况 对 叶 尖 识别 的 干扰 ， 在 不 同 光 照 条 件 下 可 实 
现 自 适应 检测 ， 模 型 鲁 棒 性 强 。 在 叶片 稀 跑 的 出 苗 
期 ，YOLOv8-CSD 模型 实现 了 无 漏 检 的 检测 效果 。 
在 叶片 密度 较 大 的 分 药 期 和 越冬 期 ， 模 型 依旧 保持 
较 低 的 漏 检 率 ， 模 型 泛 化 性 强 。 
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目前 ， 国 内 外 对 小 麦 出 苗 期 OP BN A Be BAS 
期 的 叶片 数 检测 研究 较 少 ， 本 人 研究 通过 检测 小 麦 叶 
尖 的 数量 推断 出 叶片 数 ， 为 小 麦 叶 片 快速 计数 提供 
了 可 行 的 方案 。 所 提出 的 方法 能 够 满足 小 麦 叶 尖 的 
有 效 识 别 ， 实 现 了 复杂 大 田 环境 下 幼苗 期 小 麦 叶片 
数 的 检测 ， 有 助 于 提高 叶片 数 检测 工作 的 自动 化 程 
度 ， 为 小 麦 长 势 高 质量 评估 提供 技术 支撑 。 但 改进 
后 模型 在 对 分 蔓 期 以 后 的 小 麦 叶片 检测 过 程 中 依旧 
出 现 错 检 和 漏 检 现象 ， 识 别 准确 率 仍 有 提升 空间 。 
下 一 步 研究 拟 补充 小 老 其 他 生长 期 的 叶片 图 像 以 丰 
寅 模型 的 训练 集 ， 提 高 模型 的 识别 精度 和 泛 化 能 
力 ， 并 探索 检测 模型 的 轻 量 化 方法 以 便于 边缘 端 
部 署 。 
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A Rapid Detection Method for Wheat Seedling Leaf Number 
in Complex Field Scenarios Based on Improved YOLOv8 
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Abstract: 

[Objective] The enumeration of wheat leaves is an essential indicator for evaluating the vegetative state of wheat and predicting its 
yield potential. Currently, the process of wheat leaf counting in field settings is predominantly manual, characterized by being both 
time-consuming and labor-intensive. Despite advancements, the efficiency and accuracy of existing automated detection and counting 
methodologies have yet to satisfy the stringent demands of practical agricultural applications. This study aims to develop a method for 
the rapid quantification of wheat leaves to refine the precision of wheat leaf tip detection. 

[Methods] To enhance the accuracy of wheat leaf detection, firstly, an image dataset of wheat leaves across various developmental 
stages—seedling, tillering, and overwintering—under two distinct lighting conditions and using visible light images sourced from 
both mobile devices and field camera equipmen, was constructed. Considering the robust feature extraction and multi-scale feature fu- 
sion capabilities of YOLOv8 network, the foundational architecture of the proposed model was based on the YOLOv8, to which a co- 
ordinate attention mechanism has been integrated. To expedite the model's convergence, the loss functions were optimized. Further- 
more, a dedicated small object detection layer was introduced to refine the recognition of wheat leaf tips, which were typically diffi- 
cult for conventional models to discern due to their small size and resemblance to background elements. This deep learning network 
was named as YOLOv8-CSD, tailored for the recognition of small targets such as wheat leaf tips, ascertains the leaf count by detect- 
ing the number of leaf tips present within the image. A comparative analysis was conducted on the YOLOv8-CSD model in compari- 
son with the original YOLOv8 and six other prominent network architectures, including Faster R-CNN, Mask R-CNN, YOLOv7, and 
SSD, within a uniform training framework, to evaluate the model's effectiveness. In parallel, the performance of both the original and 
YOLOv8-CSD models was assessed under challenging conditions, such as the presence of weeds, occlusions, and fluctuating lighting, 
to emulate complex real-world scenarios. Ultimately, the YOLOv8-CSD model was deployed for wheat leaf number detection in intri- 
cate field conditions to confirm its practical applicability and generalization potential. 

[Results and Discussions] The research presented a methodology that achieved a recognition precision of 91.6% and an mAP,, of 
85.1% for wheat leaf tips, indicative of its robust detection capabilities. This method exceled in adaptability within complex field envi- 
ronments, featuring an autonomous adjustment mechanism for different lighting conditions, which significantly enhanced the model's 
robustness. The minimal rate of missed detections in wheat seedlings' leaf counting underscored the method's suitability for wheat leaf 
tip recognition in intricate field scenarios, consequently elevating the precision of wheat leaf number detection. The sophisticated algo- 
rithm embedded within this model had demonstrated a heightened capacity to discern and focus on the unique features of wheat leaf 
tips during the detection process. This capability was essential for overcoming challenges such as small target sizes, similar back- 
ground textures, and the intricacies of feature extraction. The model's consistent performance across diverse conditions, including sce- 
narios with weeds, occlusions, and fluctuating lighting, further substantiated its robustness and its readiness for real-world application. 
[Conclusions] This research offers a valuable reference for accurately detecting wheat leaf numbers in intricate field conditions, as well 
as robust technical support for the comprehensive and high-quality assessment of wheat growth. 


Key words: wheat leaves; tip detection; leaf counting; attention mechanism; YOLOv8; deep learning 


Foundation items: National Natural Science Foundation of China (32371993); Key Research and Development Plan of Anhui Province 
(202204c06020026, 2023n06020057); Natural Science Research Key Project of Anhui Provincial University (2022AH040125, 
2023AH040135) 
Biography: HOU Yiting, E-mail: wjx0626fmvp @ 163.com 
* Corresponding author: RAO Yuan, E-mail: raoyuan @ahau.edu.cn 

(登录 www.smartag.netcn 免费 获取 电子 版 全 文 ) 


